package com.thinvent.recommend.manager.manager;

import com.thinvent.recommend.manager.dto.KbFileContentDTO;

import java.util.List;
import java.util.Map;

/**
 * TF–IDF 向量化管理器：将一批文档内容转换成稀疏的 TF–IDF 向量
 */
public interface TfIdfVectorManager {
    /**
     * 对 docs 列表中每个文档计算 TF–IDF 向量
     * @param docs 已有 content 的文档 DTO 列表
     * @return Map<docId, Map<term, tfidf>>, 即每个文档对应的稀疏向量
     */
    Map<String, Map<String, Double>> computeTfIdfVectors(List<KbFileContentDTO> docs);
}
